ترکیب یادگیرنده ی چند برچسبی iblr-ml با تکنیک های کیسه ای و ترفیعی، جهت بهبود روی داده های نامتوازن

پایان نامه
چکیده

قه بندی چند برچسبی گسترش یافته روش های طبقه بندی سنتی است. که در آن هر نمونه می تواند به مجموعه ای از برچسب ها متعلق باشد. مثال هایی از داده های چند برچسبی در کاربرد های واقعی بسیار زیاد است که خود بیانگر اهمیت آن می باشد. به عنوان مثال یک فیلم می تواند به طور هم زمان هم به عنوان جنگی، هم جنایی و هم هیجان انگیز برچسب بخورد. از سوی دیگر مشاهده می شود که اکثر مجموعه های داده ای، در دنیای واقعی به صورت نامتوازن هستند. از این رو به بهبود روش طبقه بندی چند برچسبی، روی مجموعه داده های نامتوازن پرداخته خواهد شد. الگوریتم iblr_ml از ترکیب دو الگوریتم نزدیک ترین همسایه و رگرسیون منطقی ایجاد شده است. در این پایان نامه برای افزایش قدرت تحمل این الگوریتم، در مقابل داده های نامتوازن، این روش با الگوریتم های تجمعی کیسه ای و ترفیعی ترکیب گردیده. در نهایت برای ارزیابی روش پیشنهادی، بامجموعه داده های متفاوتی اجرا گردیده که نتایج بیانگرکارایی خوب روش پیشنهادی است. ایده دیگری که در این پایان نامه به آن پرداخته شده، ارائه اولین روش برای چند برچسبی کردن مجموعه داده تک برچسبی و به کار گیری آن برای مجموعه داده مرتبط با مخازن نفت می باشد. سپس بااستفاده از مجموعه داده چند برچسبی حاصله والگوریتم پیشنهادی،یک یادگیرنده جهت پیشنهاد بهترین روش ازدیاد برداشت از مخازن نفت جدید ایجادشده است. همچنین تلاش شد که برای بهبود کارایی الگوریتم iblr-ml، بخش دوم آن با الگوریتم ivm جایگزین گردد. نتایج حاصل از ارزیابی نشان می دهد که این الگوریتم نسبت به تمام الگوریتم هایی که در رده پایین تری از iblr-ml قرار گرفته اند کارایی بهتری دارد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

دسته بندی داده های چند برچسبی با استفاده از سامانه های دسته بندی یادگیرنده

دسته بندی یکی از مهمترین فرآیندهای مورد مطالعه در حوزه یادگیری ماشین و داده کاوی است که در برنامه های کاربردی فراوانی از جمله دسته بندی متن، تشخیص پزشکی، بیوانفورماتیک و... مورد استفاده قرار می گیرد. مسائل دسته بندی را می توان براساس تعداد برچسب های منتسب به هر یک از داده ها به دو دسته کلی مسائل دسته بندی تک برچسبی و مسائل دسته بندی چند برچسبی تقسیم کرد. در مسائل دسته بندی تک برچسبی، هر داده دا...

بهبود طبقه بندی داده های نامتوازن

یکی از حوزه های مهم در داده کاوی طراحی الگوریتم های کلاس بندی با دقت بالا است. این امر به ویژه در شرایطی که داده ها دارای پراکندگی نامتوازن باشند، پیچیدگی بیشتری پیدا می کند. یادگیری کلاس نامتوازن به یادگیری از مجموعه داده های نامتوازن اشاره دارد که در آن تعداد نمونه های کلاس گروه اقلیت به طور قابل توجه ای کمتر از نمونه های کلاس گروه اکثریت است. به توجه به اینکه اکثر الگوریتم های یادگیری، طبقه ...

بهبود روش مبتنی بر شاخص گیاهی جهت برآورد گسیلمندی سطح با استفاده از آنالیز رگرسیون چند متغیره بر روی داده های لندست 8

گسیلمندی سطح زمین از جمله متغیرهایی است که در دامنه وسیعی از مطالعات و تحقیقات علوم زمین و محیط زیست کاربرد دارد و یکی از پارامترهای اساسی در برآورد دمای سطح می باشد. فناوری سنجش از دور، امکان پایش این کمیت را در سطح وسیعی فراهم می آورد. تغییرات گسیلمندی وابسته به پارامترهای سطح (نظیر بافت، توپوگرافی، رطوبت) و سنجنده ( نظیر قدرت تفکیک مکانی، تابع پاسخ طیفی ، و طول موج موثر باندها ) می باشد. در ...

متن کامل

کاربرد تکنیک های مدل یابی چند سطحی در تحلیل داده های تیمز 2007 و مقایسه آن با تحلیل یک سطحی

زمینه: در رویکرد سنتی تحلیل داده های IEA از مدل های آماری یک سطحی استفاده می شد. در حالی که در ساختار مدل های خطی سلسله مراتبی، هر یک از سطوح به طور متداول توسط زیر مدل خود معرفی می شود و روابط بین متغیرها را در داخل سطح مشخص شده بیان می کنند و تعیین می کنند که چگونه متغیرها در یک سطح روابط موجود در سطح دیگر را تحت تاثیر قرار می دهند. هدف: هدف پژوهش حاضر نشان دادن اهمیت کاربرد تکنیک چند سطحی در...

متن کامل

استفاده از تکنیک های داده کاوی جهت تشخیص دیابت با استفاده از چربی خون

مقدمه: بیماری دیابت یکی از شایع ترین، خطرناک ترین و پرهزینه ترین بیماری های حال حاضر دنیا است که با نرخ هشدار دهنده ای در حال افزایش است. استفاده از روش‌ های داده‌ کاوی می تواند به تشخیص زودهنگام دیابت کمک کند که باعث جلوگیری از پیشرفت این بیماری و خیلی از عوارض آن مانند بیماری قلب و عروق، مشکلات بینایی و بیماری های کلیوی می شود. مواد و روش ها: در این تحقیق از نرم افزار داده کاوی رپیدماینر برای...

متن کامل

بررسی و سنجش دقت زاویه ای الگوریتم های ML، MUSIC، Root-MUSIC و هموارسازی فضایی در تشخیص جهت ورود سیگنال

در این مقاله ابتدا به شبیه سازی الگوریتم های ML، MUSIC، Root-MUSIC و هموارسازی فضایی در محیط دارای نویز و فیدینگ پرداخته و سپس این الگوریتم ها از لحاظ تخمین میزان دقت زاویه های رسیده از دو منبع مقایسه شده اند. با ارایه نتیجه های شبیه سازی چهار الگوریتم در قالب جدول هایی که بر حسب میانگی...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده ریاضی و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023